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(57) Abstract: The invention relates to the synthesis 
and the joint spatial ization of sounds emitted by vir- 
tual sources. According to the invention, a step (ETA) 
is provided that consists of determining parameters in- 
cluding at least one gain (gi) for defining, at the same 
time, a loudness characterizing the nature of the vir- 
tual source and the position of the source relative to a 
predetermined origin. 

(57) Abrege : L 'invention concerne la synthese et la 
spatialisation conjointe de sons issus de sources vir- 
tuelles. Selon l'invention, on prevoit une meme etape 
(ETA) consistant a determiner des parametres incluant 
au moins un gain (gi), pour definir en meme temps: 
une intensite sonore caracterisant la nature de source 
virtuelle, et la position de la source par rapport a une 
origine predeterminee. 
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Precede de synthese et de spatialisation sonores 

La presente invention concerne la synthese de signaux 
audio, notamment dans des applications d' edition musicale, 
5 de jeux video, ou encore de sonneries pour des telephones 
mobiles . 

Plus particulierement , 1 ' invention concerne a la fois des 
techniques de synthese sonore et des techniques du son 
10 tridimensionnel (ou "3D"). 

Pour offrir des services innovants, bases sur la synthese 
sonore (pour creer des sonneries, ou encore dans le cadre 
de jeux sur telephones mobiles) , on cherche actuellement a 
15 enrichir les methodes de synthese sonore. Cependant, les 
terminaux etant limites en termes de memo ire et de 
puissance de calcul, il est preferable de developper des 
procedes a la fois efficaces et economes en complexite. 

20 * Les techniques de synthese sonore 

De nombreuses techniques de synthese sonore ont ete 
developpees dans les dernieres decennies . On indique qu'il 
n'existe pas, en realite, de technique universelle capable 
de generer n'importe quel son. En effet, les modeles de 
25 production qui ont ete etablis jusqu'a present ont chacun 
leurs restrictions. Une taxinomie etablie par Julius Smith 
dans : 

"Viewpoints on the History of Digital Synthesis", Smith 
J.O; Keynote paper, Proc . Int. Comp . Music Conf . 1991, 
30 Montreal, 

est presentee ci-dessous. 
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Les techniques sont categorisees en quatre groupes : 

les techniques calculatoires (FM pour "frequency 
modulation", "wave shaping" pour le travail cie formes 
5 d 1 ondes, etc) , 

le "sampling" et autres traitements d'enregistrements 
(par exemple une synthese par table d'onde, etc), 
les techniques fondees sur des modeles spectraux 
(tels que la synthese additive, ou encore le "source- 
10 f iltre" , etc) , 

les techniques fondees sur des modeles physiques 
(synthese modale, par guides d'onde,...). 

Certaines techniques, selon leur usage, peuvent toraber 
15 dans plusieurs categories. 

Le choix de la technique de synthese adaptee a un terminal 
ou a un systeme de rendu peut se faire en fonction de 
trois families de criteres, notamment des criteres du type 
20 de ceux proposes par le laboratoire d'acoustique et de 
traitement du signal de l'universite d' Helsinki dans le 
cadre d'une evaluation des differentes methodes de 
synthese : 

"Evaluation of Modern Sound Synthesis Methods" , Tolonen 
25 T., Valimaki V., Karjalainen M; Report 48, Espoo 1998. 

Une premiere famille de criteres concerne I'emploi des 
parametres suivants : 

1 7 intuit ivite , 
30 - la perceptibilite, 

le sens physique 
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et le comportement . 

La qualite et la diversite des sons qui sont produits 
determinent la seconde famille de criteres, selon les 
5 parametres suivants : 

robustesse de l'identite du son, 
etendue de la palette sonore, et 
- avec une phase preliminaire d' analyse, le cas 
echeant . 

10 

Enfin, la troisieme famille de criteres traite des 
solutions d ' implementation, avec des parametres tels que : 

le cout des calculs, 

la memoire necessaire , 
15 - le controle, la latence et les traitements 

multitaches . 

II est apparu recemment que les techniques reposant sur 
une modelisation spectrale (avec reproduction de 1' image 
20 spectrale pergue par un auditeur) ou une modelisation 
physique (avec simulation de l'origine physique du son) 
sont les plus satisf aisantes et presentent un large 
potentiel pour les systemes f uturs . 

25 Cependant, actuellement , les methodes basees sur la 
synthese par table d'ondes sont les plus repandues . Le 
principe de cette technique est le suivant . Tout d'abord, 
tous les signaux audio naturels peuvent se decomposer en 
quatre phases : attaque, declin, soutien et relachement, 

30 regroupees generalement sous le terme " d* enveloppe ADSR" 
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(de 1' anglais: Attack, Decay, Sustain, Release) qui' sera 
decrite plus loin. 

Le principe de la synthese par table d'ondes consiste a 
5 prendre une ou plusieurs periodes de signal (correspondant 
a un enregistrement ou a un signal synthetique) , puis a 
lui appliquer des traitements (avec mise en boucle, 
modification de la frequence f ondamentale, etc) et enfin a 
lui appliquer 1 1 enveloppe ADSR precitee. Cette methode de 

10 synthese tres simple permet d'obtenir des resultats 
satisf aisants . Une technique voisine de la synthese par 
table d'ondes est celle dite de "sampling" qui s 1 en 
distingue toutefois par le fait qu ! elle utilise des 
enregistrements de signaux naturels a la place de signaux 

15 synthetiques . 

Un autre exemple de synthese simple est la synthese par 
modulation de frequence, plus connue sous le nom de 
"synthese FM" . Ici, on effectue une modulation de 
20 frequence pour laquelle la frequence du modulant et du 
module (f m et f c ) se trouve dans le domaine audible (20 a 
20000 Hz) . On indique aussi que les amplitudes respectives 
des harmoniques par rapport au mode fondamental peuvent 
etre choisies pour definir un timbre du son. 

25 

II existe differents formats de transmission de 
1 1 information destinee aux synthetiseurs sonores . Tout 
d f abord, il est possible de transmettre une partition 
musicale aux formats MIDI ou selon la norme MPEG4- 
30 Structured ' Audio pour qu'elle soit ensuite synthetisee par 
la technique de synthese sonore choisie. Dans certains 
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systemes, il est aussi possible de transmettre des 
informations sur les instruments a utiliser par le 
synthetiseur , par exemple en utilisant le format DLS qui 
permet de transmettre les informations necessaires a la 
5 synthese de sons par table d'ondes. De meme, des langages 
algorithmiques de type " CSound" ou "MPEG-4 SAOL" 
permettent de representer les sons en temps que technique 
de synthese sonore. 

10 La presente invention concerne la combinaison de la 
synthese sonore avec la spatialisation des sons issus de 
cette .synthese. On rappelle ci-apres quelques techniques 
de spatialisation sonore connues . 

15 * Les techniques de spatialisation sonore 

II s'agit de precedes de traitement du signal audio 
appliques a la simulation de phenomenes acoustiques et 
psycho-acoustiques . Ces techniques visent la generation de 
signaux a diffuser sur haut-parleurs ou sur ecouteurs, 
20 afin de donner a l'auditeur l 1 illusion auditive de sources 
sonores placees a une position predeterminee autour de 
lui . Elles trouvent une application avantageuse dans la 
creation de sources et d 1 images sonores virtuelles. 

25 Parmi les techniques de spatialisation sonore, on 
distingue principalement deux categories. 

Les procedes bases sur une approche physique consistent 
generalement a reproduire le champ sonore a 1 1 identique du 
30 champ acoustique original au sein d'une zone de dimensions, 
f inies . Ces procedes ne prennent pas en compte a priori 
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les proprieties perceptives du systeme auditif, notamment 
en termes de localisation auditive. Avec de tels systemes , 
l ! auditeur est ainsi plonge dans un champ en tout point 
identique a celui qu'il aurait pergu en presence des 
5 sources reelles et il est done capable de localiser les 
sources sonores comme dans une situation d'ecoute reelle. 

Les precedes bases sur une approche psycho-acoustique 
cherchent plutot a tirer parti des mecanismes de 
perception sonore 3D afin de simplifier le processus de 
reproduction sonore. Par exemple, au lieu de reproduire le 
champ sonore sur toute une zone, on peut se contenter de 
le reproduire uniquement au niveau des deux oreilles de 
l'auditeur. De meme, on peut imposer une reproduction 
fidele du champ sonore sur une fraction du spectre 
seulement, afin de relacher la contrainte sur le reste du 
spectre. L'objectif est de tenir compte des mecanismes de 
perception du systeme auditif afin d' identifier la 
quantite minimale d 1 information a reproduire. pour obtenir 
un champ psycho-acoustiquement identique au champ 
original, c 1 est a dire tel que l ! oreille, en raison de la 
limitation de ses performances, soit incapable de les 
distinguer l'un de 1' autre. 

25 Dans la premiere categorie, differentes techniques ont ete 
identifiees : 

- 1 ! holophonie, qui est typiquement une technique de 
reconstruction physique d'un champ sonore, 
puisqu ! elle constitue 1 1 equivalent acoustique de 
30 1 ! holographie . Elle consiste a reproduire un champ 

sonore a partir d'un enregistrement sur une surface 



15 
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(sphere creuse, ou autre) . De plus amples details 
sont donnes dans : 

"Restitution soxiore spatialisee sur une zone etendue: 
Application a la telepresence" , R. Nicol; These de 
5 l'Universite du Maine, 1999 ; 

la technique ambiophonique (de 1' anglais 

" ambisonic") , qui est un autre exemple de 
reconstruction physique du champ acoustique, 
utilisant une decomposition du champ sonore sur une 
10 base de fonctions propres, appelees " harmonicfues 

spheriques" . 

Dans la seconde categorie, on identifie par exemple : 

la stereophonie , qui exploite des differences de 

15 temps ou d'intensite pour positionner les sources 

sonores entre deux haut-parleurs , sur la base des 
differences interaurales de temps et d'intensite qui 
definissent les criteres perceptifs de localisation 
auditive dans un plan horizontal ; 

20 - les techniques binaurales qui visent a reconstruire 

le champ sonore uniquement au niveau des oreilles de 
l'auditeur, de telle sorte que ses tympans pergoivent 
un champ sonore identique a celui qu'auraient induit 
les sources reelles. 

25 

Chaque technique se caracterise par une methode specifique 
d'encodage et de decodage des informations de 
spatialisation sous un format adequat de signaux audio. 

30 Les differentes techniques de spatialisation sonore se 
distinguent egalement par 1 1 etendue de la spatialisation 
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qu'elles fournissent. Typiquement , une spatialisation 3D 
telle que 1 1 encodage ambiophonique , 1 1 holophonie , la 
synthese binaurale ou transaurale (qui est une 
transposition cie la technique binaurale sur deux haut- 
5 parleurs distants) inclut toutes les directions de 
l'espace. Par ailleurs, une spatialisation 

bidimensionnelle ("20"), telle que la stereophonie , ou une 
restriction 2D de 1 ! holophonie ou de la technique 
ambi sonique, est limitee au plan horizontal. 

10 

Enfin les differentes techniques se distinguent par leurs 
possibles systemes de diffusion, par exemple : 

une diffusion sur casque pour les techniques 
binaurales, ou la stereophonie, 
15 - une diffusion sur deux haut -parleurs , notamment pour 

la stereophonie ou pour un systeme transaural, 
- ou une diffusion sur un reseau a plus de deux haut- 
parleurs, pour une zone d'ecoute etendue (notamment 
pour des applications multi-auditeurs) , en 
20 holophonie, ou en restitution ambiophonique. 



Une large gamme de dispositifs actuels offre des 
possibilites de synthese sonore . Ces dispositifs vont de 
1 ! instrument de musique (tel qu'un clavier, une boite a 

25 rythmes, ou autres) , des terminaux mobiles, par exemple de 
type PDA (pour "Personal Digital Assistant"), ou encore 
des ordinateurs sur lesquels sont installes des logiciels 
d 1 edition musicale, ou encore des pedaliers d'effets dotes 
d'une interface MIDI . Les systemes de restitution sonore 

30 (casque, haut -parleurs stereo ou systemes a haut -parleurs 
multiples) et la qualite des systemes de synthese de sons 
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sont tres varies, notamment selon les capacites de calcul 
plus ou moins limitees et selon les environnements 
d' utilisation de tels systemes. 

5 On connait actuellement des systemes capables de 
spatialiser des sons prealablement synthetises, en 
particulier par une mise en cascade d'un moteur de 
synthese sonore et d'un moteur de spatialisation. La 
spatialisation est alors appliquee au signal de sortie du 
10 synthetiseur (sur une voie mono ou deux voies stereo) 
apres mixage des dif f erentes sources. On connait ainsi des 
mises en oeuvre de cette solution pour alors spatialiser 
les sons issus d'un synthetiseur. 

15 On connait plus generalement des mises en oeuvre 
consistant en des moteurs de rendu 3D, qui peuvent 
s ! appliquer a tout type de signaux audionumeriques , qu'ils 
soient synthetiques ou non. Par exemple, les differents 
instruments de musique d'une partition MIDI (format 

20 classique de synthese sonore) peuvent etre alors 
positionnes dans l f espace sonore. Toutefois, pour obtenir 
une telle spatialisation, il faut d'abord convertir les 
signaux midi en signaux audionumeriques et ensuite 
appliquer a ces derniers un traitement de spatialisation. 

25 

Cette mise en oeuvre est particulierement couteuse en 
termes de temps de traitement et de complexite de 
traitement . 
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L'un des buts de la presente invention est un procede de 
synthese sonore offrant la possibility de spatialiser 
directement les sons synthetiques. 

5 Plus particulierement , un but de la presente invention est 
d'associer a la synthese sonore des outils de 
spatialisation de qualite satisf aisante . Toutefois, cette 
association cumule la complexite due a la synthese sonore 
a celle de la spatialisation, ce qui rend difficile 
10 1 ' implementation d'une synthese sonore spatialisee sur des 
terminaux a fortes contraintes (c'est-a-dire a puissance 
de calcul et a taille memoire relativement limitees) . 

Un autre but de la presente invention vise une 
15 optimisation de la complexite de la spatialisation des 
sons synthetiques selon les capacites du terminal. 

A cet effet, la presente invention propose tout d ! abord un 
procede de synthese et de spatialisation sonores, dans 
20 lequel un son synthetique a generer est caracterise par la 
nature d'une source sonore virtuelle et par sa position 
par rapport a une origine choisie. 

Le procede au sens de l f invention comporte une etape 
25 conjointe consistant a determiner des parametres incluant 
au moins un gain, pour definir en meme temps: 

une intensite sonore caracterisant la nature de la 
source, et 

- la position de la source par rapport a une origine 
30 predeterminee . 
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On comprendra ainsi que la presente invention permet 
d'integrer une technique de spatialisation du son a une 
technique de synthese sonore, de fagon a obtenir un 
traitement global utilisant des parametres communs pour la 
5 mise en ceuvre des deux techniques. 

Dans une realisation, la spatialisation de la source 
virtuelle s'effectue en contexte ambiophonique . Le procede 
comporte alors une etape de calcul de gains associes a des 
10 composantes ambiophoniques dans une base d 1 harmoniques 
spheriques . 

Dans une variante, le son synthetique est destine a etre 
restitue en contexte holophonique , ou binaural, ou 

15 transaural, sur une pluralite de voies de restitution. On 
comprendra en particulier que cette "pluralite de voies de 
restitution" peut aussi bien concerner deux voies de 
restitution, en contexte binaural ou transaural, ou encore 
plus de deux voies de restitution, par exemple en contexte 

20 holophonique. Pendant ladite etape conjointe, on determine 
en outre un retard entre voies de restitution, pour 
definir en meme temps : 

- un instant de declenchement du son caracterisant la 
nature de la source, et 
25 - la position de la source par rapport a une origine 
predeterminee . 

Dans cette realisation, la nature de la source virtuelle 
est parametree au moins par une variation temporelle 
30 d ! intensite sonore, sur une duree choisie et incluant un 
instant de declenchement du son. En pratique, cette 
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variation temporelle peut avantageusement etre representee 
par une enveloppe ADSR telle que decrite ci-avant. 

Pref erentiellement , cette variation comporte au moins : 
5 - une phase ci'attaque instrumentale, 

- une phase de declin, 

- une phase de soutien, et 

- une phase de relachement . 

Bien entendu, des variations plus complexes d 1 enveloppe 
10 peuvent etre envisagees. 

La spatialisation de la source virtuelle s'effectue 
pref erentiellement par une synthese binaurale basee sur 
une decomposition lineaire de fonctions de transfert, ces 

15 fonctions de transfert s 1 exprimant par une combinaison 
lineaire de termes dependant de la frequence du son et 
ponderes par des termes dependant de la direction du son. 
Cette mesure s ' avere avantageuse notamment lorsque la 
position de la source virtuelle est susceptible d'evoluer 

20 dans le temps et/ou lorsque plusieurs sources virtuelles 
sont a spatialiser. 

Pref erentiellement , la direction est definie par au moins 
un angle azimutal (pour une spatialisation dans un simple 
25 plan) et, de preference, par un angle azimutal et un angle 
d' elevation (pour un spatialisation en trois dimensions). 

Dans le contexte d'une synthese binaurale basee sur une 
decomposition lineaire des fonctions de transfert, la 
30 position de la source virtuelle est avantageusement 
parametree au moins par : 
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plusieurs filtrages, fonctions de la frequence 
sonore, 

plusieurs gains de ponderation associes chacun a un 
filtrage, et 

5 un retard par voie "gauche" et "droite" . 

Pref erentiellement , la nature de la source virtuelle est 
parametree au moins par un timbre sonore, en associant des 
intensites sonores relatives choisies a des harmoniques 
10 d'une frequence correspondant a une hauteur tonale du son. 
En pratique, cette modelisation s'effectue avantageusement 
par une synthese FM, decrite ci-avant. 

Dans une realisation avantageuse, on prevoit un moteur de 
15 synthese sonore propre a generer des sons spatialises, par 
rapport a une origine predeterminee. 

Pref erentiellement , le moteur de synthese est implements 
en contexte d' edition musicale, et 1 1 on prevoit en outre 
20 une interface homme /machine pour placer la source 
virtuelle a une position choisie par rapport a 1 1 origine 
predeterminee . 

Pour synthetiser et spatialiser une pluralite de sources 
25 virtuelles, on assigne chaque source a une position 
respective, pref erentiellement en utilisant une 
decomposition lineaire des fonctions de transfert en 
contexte binaural, comme indique ci-avant, 

30 La presente invention vise aussi un module de generation 
de sons synthetiques , comprenant notamment un processeur, 
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et comportant en particulier une memoire de travail propre 
a stocker des instructions pour la mise en oeuvre du 
procede ci-avant, de maniere a traiter simultanement une 
synthese et une spatialisation du son, selon I'un des 
5 avantages que procure la presente invention. 

A ce titre la presente invention vise aussi un produit 
programme d' ordinateur , stocke dans une memoire d'une 
unite centrale ou d'un terminal, notamment mobile, ou sur 
10 un support amovible propre a cooperer avec un lecteur de 
ladite unite centrale, et comportant des instructions pour 
la mise en oeuvre du procede ci-avant. 

D'autres caracteristiques et avantages de I 1 invention 
15 apparaitront a 1 1 examen de la description detaillee ci- 
apres, et des dessins annexes sur lesquels : 

- la figure 1 illustre schematiquement des positions de 
sources sonores i et des positions de microphones j dans 
1 1 espace tridimensionnel , 

20 - la figure 2 represente schematiquement un traitement 
simultane de spatialisation et de synthese sonore, au sens 
de l 1 invention, 

- la figure 3 represente schematiquement 1 ! application de 
fonctions de transfert HRTFs a des signaux S± pour une 

25 spatialisation en synthese binaurale ou transaurale, 

la figure 4 represente schematiquement 1 1 application 
d'une paire de retards (un retard par voie gauche ou 
droite) et de plusieurs gains (un gain par filtre 
direct ionnel) en synthese binaurale ou transaurale, 

30 utilisant la decomposition lineaire des HRTFs, 
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- la figure 5 represente schematiquement 1 1 integration du 
traitement de spatialisation, au sein d'une pluralite de 
generateurs de sons synthetiques, pour une spatialisation 
et une synthese sonore en une seuleetape, 

5 - la figure 6 represente un modele d ! enveloppe ADSR en 
synthese sonore, 

- et la figure 7 represente schematiquement un generateur 
de son en synthese FM. 

10 On rappelle que la presente invention propose d'integrer 
une technique de spatialisation du son a une technique de 
synthese sonore de fagon a obtenir un traitement global, 
optimise, de synthese sonore spatialisee. Dans le contexte 
de terminaux a fortes contraintes, la mise en commun de 

15 certaines des operations de synthese sonore, d'une part, 
et de spatialisation sonore, d ' autre part, s 1 avere 
particulierement interessante . 

De fagon generale, un moteur de synthese sonore 
20 (typiquement un "synthetiseur") a pour role de generer un 
ou plusieurs signaux synthetiques, sur la base d ! un modele 
de synthese des sons, modele qui est pilote a partir d'un 
ensemble de parametres, appeles ci-apres "parametres de 
synthese" . Les signaux synthetiques generes par le moteur 
25 de synthese peuvent correspondre a des sources sonores 
distinctes (qui sont, par exemple, les differents 
instruments d'une partition) ou peuvent etre associes a 
une meme source, par exemple dans le cas de differentes 
notes d'un meme instrument. Par la suite, les termes 
30 "generateur de sons" designent un module de production 
d'une note musicale. Ainsi, on comprendra qu'un 
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synthetiseur est compose d'un ensemble cie generateurs de 
sons . 



De fa?on generale encore, un outil de spatialisation 
5 sonore est un outil qui admet un nombre donne de signaux 
audio en entree, ces signaux etant representatif s de 
sources sonores et, en principe, exempts de traitement de 
spatialisation. On indique en fait que, si ces signaux ont 
deja subi un traitement spatialise, ce traitement 

10 prealable n'est pas pris en compte ici . L 1 outil de 
spatialisation a pour role de traiter les signaux 
d 1 entree, selon un schema qui est specif ique a la 
technique de spatialisation choisie, pour generer un 
nombre donne de signaux de sortie qui definissent les 

15 signaux spatialises representatif s de la scene sonore au 
format de spatialisation choisi. La nature et la 
complexite du traitement de spatialisation dependent 
evidemment de la technique choisie, selon que 1 1 on 
considere un rendu au format stereophonique , binaural, 

20 holophonique ou ambiophonique . 



Plus particulierement , pour de nombreuses techniques de 
spatialisation, il apparalt que le traitement se ramene a 
une phase d ! encodage et une phase de decodage, comme on le 
25 verra plus loin. 

L ' encodage correspond a la prise de son du champ sonore 
genere par les differentes sources a un instant donne. Ce 
systeme de prise de son "vijrtuel" peut etre plus ou moins 
30 complexe suivant la technique de spatialisation sonore 
retenue. Ainsi, on simule une prise de son par un nombre 
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plus ou moins important de microphones . avec des positions 
et des directivites differentes. Dans tous les cas, 
I'encodage se ramene, pour calculer la contribution d'une 
source sonore, au moins a 1 ■ application de gains et, le 
plus souvent, de retards (typiguement en holophonie ou en 
synthese binaurale ou transaurale) a differentes copies du 
signal emis par la source. On dispose d'un gain (et, le 
cas echeant d'un retard) par source pour chaque microphone 
virtuel. Ce gain (et ce retard) dependent de la position 
de la source par rapport au microphone. Si 1 ' on prevoit un 
systeme de prise de son virtuel muni de K microphones, on 
dispose de K signaux en sortie du systeme d'encodage. 

En se referant a la figure 1, le signal Ej represente la 
somme des contributions de 1 ■ ensemble des sources sonores 
sur le microphone j. En outre, on appelle : 
Si le son emis par la source i, 

- Ej le signal encode en sortie du microphone j , 

- Gji 1 'attenuation du son Si due a la distance entre la 
source i et le microphone j , a la directivite de la 
source, aux obstacles entre la source i et le 
microphone j, et enfin a la directivite meme du 
microphone j , 

- tji le retard du son Si du a la propagation depuis la 
source i vers le microphone j , et 

- x, y, z les coordonnees cartesiennes de la position 
de la source, supposee variable dans le temps. 

Le signal encode Ej est donne par 1 • expression : 
30 Ej(t) = S S(t - tji(x, y, z)) * Gji(x, y, z)Si(t) 



20 



25 



<=i 



WO 2005/069272 



PCT/FR2003/003730 



18 



10 



15 



20 



25 



Dans cette expression, on suppose que 1 ' on doit traiter 

L sources (i = 1, 2 L ) , tandis que le format 

d'encodage prevoit K signaux (j = 1, 2 K) . Les gains 

et les retards dependent de la position de la source i par 
rapport au microphone j a 1 ' instant t. L'encodage est done 
une representation du champ sonore genere par les sources 
sonores a cet instant t. On rappelle simplement ici qu • en 
contexte ambiophonique (consistant en une decomposition du 
champ dans une base d • harmoniques spheriques) , le retard 
n'intervient pas reellement dans le traitement de 
spatialisation . 

Dans le cas ou les sources sonores sont dans une salle, il 
faut ajouter les sources - images . Ce sont les images des 
sources sonores reflechies par les murs de la salle. Les 
sources -images, en se ref lechissant a leur tour sur les 
murs, generent des sources images d'ordres superieurs . 
Dans 1' expression ci-dessus, L ne represente done plus le 
nombre de sources, mais le nombre de sources auquel on 
additionne le nombre de sources - images . Le nombre de 
sources -images est infini, c ' est pourquoi, en pratique, on 
ne garde que les sources images audibles et dont on 
percoit la direction. Les sources -images qui sont audibles 
mais dont on ne percoit plus la direction sont regroupees 
et leur contribution est synthetisee a l'aide d'un ' 
reverberateur artificiel. 



30 



L'etape de decodage vise a restituer les signaux Ej 
encodes sur un dispositif donne, comportant un nombre 
predetermine T de transducteurs sonores (casque, haut- 
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10 



parleur) . Cette etape consiste ft appliquer une matrice TxK 
de filtres aux signaux encodes. Cette matrice depend 
uniquement du dispositif de rendu, et non des sources 
sonores. Suivant la technique d-encodage et de decodage 
choisie, cette matrice pent etre tres simple (par exemple 
l'identite) ou tres complexe. 

On a represents schematiquement sur la figure 2 un 
organigramme reprenant les differentes etapes precitees. 
Une premiere etape ST constitue une etape de demarrage au 
cours de laquelle un utilisateur definit des commandes de 
sons C 1# C 2 ,..., c N a synthetiser et spatialiser (par exemple 
en prevoyant une interface homme/machine pour definir une 
note musicale, un instrument pour jouer cette note et une 
15 position de cet instrument jouant cette note dans 
l'espace). En variante, par exemple pour la spatialisation 
du son aupres d'un terminal mobile, les informations de 
spatialisation peuvent etre transmises dans un flux 
parallele au flux audio synthetique, ou encore directement 
10 dans le flux audio synthetique. 

Ensuite, on indique que 1 ' invention prevoit 
avantageusement une etape unique ETA de synthese et 
spatialisation du son, de facon conjointe. De fagon 
5 generale, un son peut etre defini au moins par : 

- la frequence de son mode fondamental, caracterisant 
la hauteur tonale, 

sa duree, 

- et son intensite. 



WO 2005/069272 



PCT/FR2003/003730 



20 

Ainsi, dans l'exemple d'un synthetiseur a clavier 
sensitif, si 1 f utilisateur joue une note forte, 
1 1 intensite associee a la commande C± sera plus grande que 
1 1 intensite associee a une note pia.no. Plus 
5 particulierement , on indique que le parametre d 1 intensite 
peut, de fagon generale, prendre en compte le gain de 
spatialisation g± dans un contexte de traitement de 
spatialisation, comme on le verra ci-apres, selon l'un des 
avantages majeurs que procure la presente invention. 

10 

En outre, un son est, bien entendu, defini aussi par son 
instant de declenchement . Typiquement , si la technique de 
spatialisation choisie n'est pas un traitement 
ambiophonique, mais plutot la synthese binaurale ou 
15 transaurale, 1 1 holophonie , ou autre, le retard de 
spatialisation x± (qui sera decrit en detail plus loin) 
peut permettre de controler en outre 1 1 instant de 
de c 1 enchement du s on . 

20 En se referant a nouveau a la figure 2, un dispositif de 
synthese et de spatialisation sonore Dl comporte : 

- un module de synthese proprement dit Ml, capable de 
definir, en fonction d'une commande Ci, au moins la 
frequence fi et la duree D± du son i associe a cette 

25 commande Ci, et 

un module de spatialisation M2, capable de definir au 
moins le gain gi (en contexte ambiophonique 
notamment) et, en outre, le retard de spatialisation 
Ti, en holophonie ou synthese binaurale ou 

30 transaurale. 
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Comme indique ci-avant, ces deux derniers parametres g± et 
ti peuvent servir conj ointement pour la spat ialisat ion, 
mais aussi pour la synthese meme du son, lorsque 1 ' on 
definit une intensite sonore (ou un panoramique en 
5 stereophonie) et un instant de declenchement du son. 

Plus generalement, on indique que dans un mode de 
realisation prefere, les deux modules Ml et M2 sont 
regroupes dans un meme module permettant de definir en une 
10 meme etape tous les parametres du signal si a synthetiser 
et spatialiser : sa frequence, sa duree, son gain de 
spatialisation, son retard de spatialisation, notamment . 

Ces parametres sont ensuite appliques a un module 
d'encodage M3 du dispositif de synthese et de 
spatialisation sonore Dl . Typiquement, par exemple en 
synthese binaurale ou transaurale, ce module M3 realise 
une combinaison lineaire sur les signaux si qui implique 
notamment les gains de spatialisation, comme on le verra 
plus loin. Ce module d'encodage M3 peut en outre appliquer 
un codage en compression sur les signaux si pour preparer 
une transmission des donnees codees vers un dispositif de 
restitution D2 . 

25 On indique toutefois que ce module d'encodage M3 est, dans 
un mode de realisation prefere, directement integre aux 
modules Ml et M2 ci-avant, de maniere a creer directement, 
au sein d'un module unique Dl qui consisterait simplement 
en un moteur de synthese et de spatialisation sonore, les 

30 signaux Ej comme s'ils etaient delivres par des 
microphones j, comme explique ci-avant. 



15 
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Ainsi, le moteur de synthese et de spatialisation sonore 
Dl produit, en sortie, K signaux sonores Ej representant 
l'encodage du champ sonore virtuel qu 1 auraient cree les 
5 differentes sources synthetiques si elles avaient ete 
reelles. A ce stade, on possede une description d'une 
scene sonore dans un format d'encodage donne . 

Bien entendu, il peut etre prevu en outre d ' additionner 
10 (ou "de mixer") a cette scene sonore d'autres scenes 
provenant d'une prise de son reelle ou de la sortie 
d'autres modules de traitement de sons, a condition 
qu 1 elles soient au meme format de spatialisation. Le 
mixage de ces differentes scenes passe ensuite dans un 
15 meme et unique systeme de decodage M'3, prevu en entree 
d'un dispositif de restitution D2 . Dans I'exemple 
represents sur la figure 2, ce dispositif de restitution 
D2 comprend deux voies, ici pour une restitution binaurale 
(restitution sur casque stereophonique) ou transaurale 
20 (restitution sur deux haut -parleurs) sur deux voies L 
et R. 

On decrit ci-apres un mode de realisation prefere de 
l f invention, ici applique a un terminal mobile et dans le 
25 contexte d'une spatialisation sonore par synthese 
binaurale . 

Sur des terminaux de telecommunication, notamment mobiles, 
on prevoit naturellement un rendu sonore avec un casque 
30 d'ecoute stereophonique. La technique de positionnement 
des sources sonores preferee est alors la synthese 
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binaurale. Elle consiste, pour chaque source sonore, a 
filtrer le signal monophonique par des fonctions de 
transf ert acoustiques appelees HRTFs (pour "Head Related 
Transfer Functions" en anglais) , qui modelisent les 
5 transformations engendrees par le torse, la tete et le 
pavilion de l'auditeur au signal provenant d'une source 
sonore. Pour chaque position de l'espace, on peut mesurer 
une paire de ces fonctions (une fonction pour l'oreille 
droite, une fonction pour l'oreille gauche) . Les HRTFs 

10 sont done fonctions de la position [6,9] (ou 0 represente 
l'azimut et cp l 1 elevation) et de la frequence sonore f. On 
obtient alors, pour un sujet donne, une base de donnees de 
2M fonctions de transfert acoustiques representant chaque 
position de l'espace pour chaque oreille (M etant le 

15 nombre de directions mesurees) . De maniere classique, la 
mise en ceuvre de cette technique se fait sous forme dite 
"jbi canal e " . 

Une autre synthese binaurale, basee sur une decomposition 
10 lineaire des HRTFs, correspond a une mise en ceuvre qui 
s'avere plus efficace en particulier lorsque plusieurs 
sources sonores sont spatialisees , ou dans le cas ou les 
sources sonores changent de position dans le temps . Dans 
ce cas, on parle de "synthese binaurale dynamique" . 

:5 

Ces deux modes de realisation de la synthese binaurale 
sont decrits ci-apres. 
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* Synthese binaurale "Jbi canal e 11 

En se referant a la figure 3, la synthese binaurale 
bicanale consiste a filtrer le signal de chaque source S± 
(i = 1, 2, N) que 1 ' on souhaite posit ionner dans 

5 l'espace a une position [Gi,(pi], par les fonctions de 
transfert acoustiques gauche (HRTF_1) et droite (HRTF_jr ) 
correspondant aux directions appropriees [0i,epi] (etape 
31) . On obtient deux signaux qui sont alors additionnes 
aux signaux gauches et droits resultant de la 

10 spat ialisat ion des autres sources (etape 32) , pour donner 
les signaux L et R diffuses aux oreilles gauche et droite 
du sujet avec un casque d'ecoute stereophonique . 



On indique que, dans cette mise en ceuvre, les positions 

15 des sources sonores ne sont pas sensees evoluer dans le 
temps. Toutefois, si l'on souhaite faire varier les 
positions des sources sonores dans l'espace au cours du 
temps, il est preferable de modifier les filtres utilises 
pour modeliser les HRTFs gauche et droite. En revanche, 

20 ces filtres se presentant sous la forme de filtres, soit a 
reponse impulsionnelle f inie (FIR) , soit a reponse 
impulsionnelle infinie (IIR) , des problemes de 
discontinuites des signaux de sortie gauche et droit 
apparaissent , entrainant des "clicks" audibles. La 

25 solution technique employee pour pallier ce probleme est 
de faire. tourner deux jeux de filtres binauraux en 
parallele. Le premier jeu simule la premiere position 
[91,91] a un instant tl, le second la seconde position 
[02, q>2] a un instant t2 . Le signal donnant l'illusion d'un 

30 displacement entre les premiere et seconde positions est 
alors obtenu par un fondu enchaine des signaux gauche et 
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droit resultant des premier et second processus de 
filtrage. Ainsi, la complexity du systeme de 
positionnement des sources sonores est alors multipliee 
par deux par rapport au cas statique. De plus, le nombre 
5 de filtres a mettre en oeuvre est proportionnel aux 
nombres de sources a spatialiser. 

Si N sources sonores sont considerees, le nombre de 
filtres necessaires est alors de 2.N pour une synthese 
10 binaurale statique et de 4.N pour une synthese binaurale 
dynamique . 

On decrit ci-apres une variante avantageuse. 

15 * Synthese binaurale basee sur une decomposition lineaire 
des HRTFs 

On indique d f abord qu'une telle mise en oeuvre presente une 
- complexity qui ne depend plus du nombre total de sources a 
positionner dans l'espace. En effet, ces techniques 

20 permettent de decomposer les HRTFs sur une base de 
fonctions orthogonales , communes a toutes les positions de 
l'espace, et ne dependent done plus que de la frequence £. 
On reduit ainsi le nombre de filtres necessaires. Plus 
particulierement , le nombre de filtres est fixe et ne 

25 depend plus du nombre de sources a positionner, de sorte 
que l'ajout d'une source sonore supplement aire ne 
necessite que 1 1 application d'un retard, avec ensuite une 
operation de multiplication par plusieurs gains dependant 
uniquement de la position [6,<p] et une operation 

30 d^ddition, comme on le verra en reference a la figure 4. 
Ces techniques de decomposition lineaire ont aussi un 
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interet dans le cas de la synthese binaurale dynamique 
(position de sources sonores variable dans le temps) . En 
effet, dans ce cas, on ne fait plus varier les 
coefficients des filtres, mais seulement les valeurs des 
5 gains qui sont fonction de la position. 

La decomposition lineaire des HRTFs vise a separer les 
dependances spatiales et f requentielles des fonctions de 
transfert. Au prealable, l'exces de phase des HRTFs est 
10 extra it , puis modelise sous la forme d'un retard pur t. La 
decomposition lineaire s 1 applique .alors a la composante a 
phase minimale des HRTFs. Chaque HRTF s'ecrit comme une 
somme de P fonctions spatiales Cj(0,<p) et de filtres de 
reconstruction Lj (f) : 

1 5 HRTF(0, <p, f) = exp(y In fx (0, C, (0, <p)Lj (/) ( 1 ) 

7=1 

Le schema de mise en ceuvre de la synthese binaurale basee 
sur une decomposition lineaire des HRTFs est illustre sur 
la figure 4. Les retards interauraux x± (etape 41) 
associes aux differentes sources sont d'abord appliques au 

20 signal de chaque source a spatialiser Si (avec i=l,...,N). 
Le signal de chaque source est ensuite decompose en P 
canaux correspondant aux P vecteurs de base de la 
decomposition lineaire. A chacun de ces canaux sont alors 
appliques les coefficients directionnels C^(0±,(pi) 

25 (notes C± t j) issus de la decomposition lineaire des HRTFs 
(etape 42) . Ces parametres de spatialisation ti et C± f j ont 
pour particularity de ne dependre que de la position 
[0i,q>i] ou l'on souhaite placer la source. lis ne 
dependent pas de la frequence sonore . Pour chaque source, 
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le nombre de ces coefficients correspond au nombre P des 
vecteurs de base que 1 1 on a utilises pour la decomposition 
lineaire des HRTFs . 

5 Pour chaque canal, les signaux des N sources sont ensuite 
additionnes (etape 43) puis filtres (etape 44) par le 
filtre Lj(f) correspondant au j ldme vecteur de base. 

Le meme schema est applique separement pour les canaux 

10 droit et gauche. La figure 4 distingue les retards 
appliques sur la voie gauche (x L i) et droite (x R i) , ainsi 
que les coefficients directionnels appliques sur la voie 
gauche {C±,j) et droite (£>i,j) - Finalement, les signaux 
sommes et filtres aux etapes 44 et 45 sont sommes a 

15 nouveaux (etape 45 de la figure 4), comme dans 1 1 etape 32 
de la figure 3, pour une restitution sur casque 
stereophonique . On indique que les etapes 41, 42 et 43 
peuvent correspondre a 1 1 encodage spatial proprement dit , 
pour la synthese binaurale, tandis que les etapes 44 et 45 

20 peuvent correspondre a un decodage spatial avant 
restitution, qu 1 ef f ectuerait le module M'3 de la figure 2, 
comme decrit ci-avant. En particulier, les signaux issus 
des sommateurs apres 1 1 etape 43 de la figure 4 peuvent 
etre vehicules via un reseau de communication, pour un 

25 decodage spatial et une restitution aupres d'un terminal 
mobile, aux etapes 44 et 45 decrites ci-avant. 

L'interet de cette mise en oeuvre est que, contrairement a 
la synthese binaurale "bicanale" , I'ajout d'une source 
30 supplemental re ne necessite pas l'ajout de deux filtres 
additionnels (de type FIR ou IIR) . En d'autres termes, les 
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P filtres de base sont partages par toutes les sources 
presentes. De plus, dans le cas de la synthese binaurale 
dynamique, il est possible de faire varier les 
coefficients Cj(0±,<pi) sans provoquer de clicks audibles 
5 en sortie du dispositif. Dans ce cas, seulement 2.P 
filtres sont necessaires, alors que 4.N filtres etaient 
necessaires pour la mise en oeuvre bicanale dynamique 
decrite ci-avant . 

10 En d'autres termes, les retards x et les gains C et D, qui 
constituent les parametres de spatialisation et sont 
specifiques a chaque source sonore en fonction de sa 
position, peuvent done etre dissocies des filtres 
directionnels L(f) dans la mise en oeuvre de la synthese 

15 binaurale basee sur une decomposition lineaire des HRTFs . 
En consequence, les filtres directionnels sont communs aux 
N sources, independamment de leur position, leur nombre ou 
leur eventuel deplacement . L 1 application des parametres de 
spatialisation represente alors 1 1 encodage spatial, 

20 proprement dit, des signaux relatifs aux sources memes, 
tandis que les filtres directionnels realisent le 
traitement effectif de decodage spatial, en vue d'une 
restitution, qui ne depend plus de la position des 
sources, mais de la frequence sonore. 

25 

En se referant a la figure 5, cette dissociation entre les 
parametres de spatialisation et les filtres directionnels 
est avantageusement exploitee en integrant 1 1 application 
du retard et du gain de spatialisation dans le 
30 synthetiseur sonore. La synthese sonore et 1 1 encodage 
spatial (retards et gains) pilote par l T azimut et 
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1 'elevation sont ainsi realises simultanement au sein d'un 
meme module tel qu'un generateur de sons, pour chaque 
signal sonore (ou note, en edition musicale) a generer 
(etape 51) . Le decodage spatial est ensuite pris en charge 
5 par les filtres directionnels I*±(f) , comme indique ci- 
avant (etape 52) . 

On decrit maintenant, en reference aux figures 6 et 7, des 
etapes de la generation de signaux en synthese sonore. En 
10 particulier, la figure 6 represente les principaux 
parametres d'une enveloppe ADSR du type precite , utilisee 
couramment dans differentes techniques de synthese sonore. 
En particulier, la figure 6 represente la variation 
temporelle de 1 'enveloppe d'un signal sonore synthetise, 
15 par exemple une note jouee sur un piano, avec : 

un parametre d'attaque, modelise par une rampe 
montante 61, correspondant par exemple a la duree 
d'un enfoncement d'un marteau centre une corde de 
piano, 

20 - un parametre de declin, modelise par une rampe 

descendante 62, a forte decroissance, correspondant 
par exemple a la duree d'un degagement d'un marteau 
d'une corde de piano, 

un parametre de soutien (vibration libre) , modelise 
25 par une rampe legerement descendante 63, due a 

1 ' amort is semen t acoustique naturel, correspondant par 
exemple a la duree d'un son d'une touche de piano 
enf oncee, 

et un parametre de relachement, modelise par une 
30 rampe descendante 64, correspondant par exemple a 
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1 1 amort is semen t acoustique rapide que produit un 

feutre sur une corde de piano. 
Bien entendu, des variations plus complexes d f enveloppe 
peuvent etre envisagees, comportant par exemple plus de 
5 quatre phases. 

On indique toutefois que la plupart des sons synthetises 
peuvent etre modelises par une variation d'enveloppe comme 
decrite ci-avant. Pref erentiellement , on definit les 
10 parametres de 1 1 enveloppe ADSR avant d'effectuer les 
filtrages prevus pour le traitement de spatialisation, en 
raison des variables de temps mises en jeu. 

On comprendra ainsi que le maximum de 1' amplitude sonore 
15 (en unite arbitraire sur la figure 6) peut etre defini par 
le traitement de spatialisation, en correspondance alors 
aux gains C±j et D±j precites, pour chaque voie gauche et 
droite. De meme, 1 1 instant de declenchement du son (debut 
de la rampe 61) peut etre defini a travers les retards x L i 
20 et T R i . 

On se refere maintenant a la figure 7 sur laquelle on a 
represents un operateur simple de synthese sonore par 
modulation de frequence ("synthese FM 11 ) . On definit 

25 initialement une frequence porteuse f c (typiquement la 
frequence du mode fondamental) , qui definit par exemple la 
tonalite d'une note de musique. On a recours ensuite a un 
ou plusieurs oscillateurs OSC1 pour definir une ou 
plusieurs harmoniques f m (correspondant en principe a des 

30 frequences multiples de la frequence porteuse f c ) , 
auxquelles sont associees des intensites relatives I m . Par 
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exemple, les intensites I m/ par rapport a 1 ' intensite du 
mode fondamental, sont plus elevees pour un son metallique 
(tel que celui d'une corde de guitare neuve) . De fagon 
generale, la synthese FM permet de definir le timbre d'un 
5 son synthetise. Les signaux (sinusoldes) issus du ou des 
oscillateurs 0SC1 sont additionnes au signal tire de la 
frequence porteuse f c par le module AD, lequel delivre un 
signal a un oscillateur de sortie OSC2 qui regoit en 
consigne 1' amplitude A c du son par rapport a la frequence 

10 porteuse f c . La encore, on indique que cette consigne A c 
peut etre direct ement definie par le trait ement de 
spatialisation, a travers les gains C et D (en synthese 
binaurale) , comme on l'a vu ci-avant . Finalement, 
1 ■ oscillateur OSC2 delivre un signal S'i, auquel on 

15 applique ensuite une enveloppe ADSR du type represents sur 
la figure 6, ainsi qu'une paire de retards x L i et x R i et 
plusieurs gains Cij et Dij , respectivement pour chaque voie 
gauche et droite, comme represents sur la figure 4, et 
pour obtenir finalement un signal tel que l f un des signaux 

20 que delivrent les generateurs de sons de la figure 5. 

On comprendra ainsi qu 1 une telle mesure permet d'eviter, 
de fagon particulierement avantageuse, de generer, a 
partir d'une partition au format MIDI, les sons dans un 
25 format standard de restitution audio (par exemple en 
format "wave") et de les encoder a nouveau pour une 
spatialisation du son, comme dans les mises en oeuvres 
connues . 

30 La presente invention permet de mettre en oeuvre 
directement et a la fois les etapes de spatialisation et 
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de synthese du son. On comprendra en particulier que tout 
traitement de synthese sonore, necessitant la definition 
d'une intensite (et, le cas echeant, un instant de 
declenchement du son) , peut etre effectue conjointement 
5 avec un traitement de spatialisation, proposant un gain 
(et, le cas echeant, un retard) par voie de restitution. 

De fagon generale, un synthetiseur de son fonctionne a 
partir de la lecture d'une partition qui regroupe les 
10 informations sur les instruments a synthetiser, les 
instants ou 1 1 on doit jouer les sons, la hauteur de ces 
sons, leur force, etc. Lors de la lecture de cette 
partition, on associe a chaque son un generateur de sons, 
comme indique ci-avant en reference a la figure 5. 

15 

On considere d'abord le cas ou une meme source joue 
plusieurs notes simultanement . Ces notes, qui proviennent 
de la meme source, sont spatialisees a la meme position et 
done avec les memes parametres . II est alors prefere de 

20 regrouper le traitement de spatialisation pour les 
generateurs de sons associes a la meme source. Dans ces 
conditions, les signaux associes aux notes issues d'une 
meme source sont pr e f e rent i e 1 1 ement sommes au prealable de 
fagon a appliquer le traitement de spatialisation 

25 globalement sur le signal resultant, ce qui, d'une part, 
reduit avantageus ement le cout d ' implementation et, 
d 1 autre part, garantit avantageusement la coherence de la 
scene sonore. 

30 En outre, les gains et les retards peuvent etre appliques 
en tirant partie de la structure du synthetiseur. D'une 
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part, les retards (voie gauche et voie droite) de 
spatialisation sont implementes sous la forme de lignes a 
retard. D ! autre part, dans le cadre du synthetiseur , les 
retards sont geres par les instants de declenchement des 
5 generateurs de sons en accord avec la partition. Dans le 
cadre d'une synthese sonore spatialisee, les deux 
approches precedentes (ligne a retard et controle de 
1 ' instant de declenchement) sont combinees de fagon a 
optimiser le traitement. On economise done une ligne a 

10 retard par source, en jouant sur les instants de 
declenchement des generateurs de sons. A cet effet, on 
extrait la difference entre les retards de la voie gauche 
et de la voie de droite pour la spatialisation. On prevoit 
ensuite d'aj outer le plus faible des deux retards a 

15 1 1 instant de declenchement du generateur. 11 reste ensuite 
a appliquer la difference de temps entre les voies gauche 
et droite a une seule des deux voies, sous la forme d'une 
ligne a retard, etant bien entendu que cette difference de 
retard peut prendre aussi bien des valeurs positives que 

20 negatives. 

En ce qui concerne les gains, le parametre de balance (ou 
de "panoramique") , qui est typiquement associe au systeme 
stereophonique, n ! a plus lieu d'etre. II est done possible 
25 de supprimer les gains associes a la balance. De plus, le 
parametre de volume du generateur de son peut etre 
applique au niveau des differents gains correspondant a 
l'encodage spatial, comme decrit ci-avant. 

30 On indique en outre que la presente invention permet 
d' appliquer la spatialisation sonore, source par source, 
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du fait que l f outil de spatialisation est integre au coeur 
du moteur de synthese sonore. Tel n'est pas le cas si I'on 
procede au contraire par simple mise en cascade du moteur 
de synthese et de l ! outil de spatialisation. Dans ce cas 
5 en effet, on rappelle que la spatialisation ne peut etre 
appliquee que globalement a 1' ensemble de la scene sonore. 

Selon un autre avantage que procure la presente invention, 
on peut associer de fagon judicieuse les outils de 

10 synthese et de spatialisation sonores, afin de realiser 
une mise en oeuvre optimisee d ! un moteur de synthese sonore 
spatialisee, avec, en particulier, une optimisation de la 
combinaison des operations de synthese et de 
spatialisation, en tenant compte notamment d T au moins un 

15 gain et/ou d'un retard de spatialisation, ou encore d'un 
filtre de spatialisation. 

Dans le cas ou les parametres de synthese appliquent deja 
1 'un ou plusieurs de ces parametres (gain, retard, 
20 filtre) , les parametres de spatialisation sont 
avantageusement pris en compte par simple modification des 
parametres de synthese, sans modification du modele de 
synthese lui-meme . 

25 Par ailleurs, par la simple addition au moteur de synthese 
sonore d'un gain et d'un retard, eventuellement completes 
par un filtre, une synthese sonore spatialisee, basee sur 
dif f erentes techniques possibles de spatialisation, peut 
etre obtenue . Ces techniques de spatialisation (synthese 

30 binaurale/transaurale, holophonie, ambiophonie, etc) 
peuvent etre de complexite et de performance variables 
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mais off rent dans 1 1 ensemble une spatialisation beaucoup 
plus riche et plus complete que la stereophonie, avec 
notamment un rendu naturel et particulierement immersif de 
la scene sonore . En effet, la spatialisation sonore au 
5 sens de 1 T invention conserve tout le potentiel d'un rendu 
sonore tridimensionnel , notamment en terme d' immersion, 
avec une veritable spatialisation en 3D. 

Bien entendu, on peut prevoir en outre une integration du 
10 traitement de spatialisation et d T effet de salle, sous la 
forme simplifiee d'au moins un gain et/ou d'un retard 
( event uellement completes de filtres) , et d'un 
reverberateur artificiel pour la reverberation tardive. 
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Revendications 

1. Procede de synthese et de spatialisation sonores, dans 
lequel un son synthetique a generer est caracterise par la 
5 nature d'une source sonore virtuelle et par sa position 
par rapport a une origine choisie, 

caracterise en ce qu'il comporte une etape conjointe 
consistant a determiner des parametres incluant au moins 
un gain, pour definir en meme temps: 
10 - une intensite sonore caracterisant la nature de la 
source, et 

la position de la source par rapport a une origine 
predeterminee . 

15 2. Procede selon la revendication 1, dans lequel la 
spatialisation de la source virtuelle s'effectue en 
contexte ambiophonique , caracterise en ce qu ' il comporte 
une etape de calcul de gains associes a des composantes 
ambiophoniques dans une base d 1 harmoniques spheriques . 

20 

3. Procede selon la revendication 1, dans lequel le son 
synthetique est destine a etre restitue en contexte 
holophonique, ou binaural, ou transaural, sur une 
pluralite de voies de restitution, 
25 caracterise en ce que, pendant ladite etape 

conjointe, on determine en outre un retard entre voies de 
restitution, pour definir en meme temps: 

- un instant de declenchement du son caracterisant la 
nature de la source, et 
30 - la position de la source par rapport a une origine 
predeterminee . 



WO 2005/069272 



PCT/FR2003/003730 



37 

4. Procede selon la revendication 3, caracterise en ce que 
la nature de la source virtuelle est parametree au moins 
par une variation temporelle d'intensite sonore, sur une 

5 duree choisie et incluant un instant de declenchement du 
son. 

5. Procede selon la revendication 4, caracterise en ce que 
ladite variation comporte au moins : 

10 - une phase d'attaque instrumentale, 

- une phase de declin, 

- une phase de soutien, et 

- une phase de relachement . 

15 6. Procede selon l'une des revendications 3 a 5, 
caracterise en ce que la spatialisation de la source 
virtuelle s ! ef f ectue par une synthese binaurale basee sur 
une decomposition lineaire de fonctions de transfert, ces 
fonctions de transfert s ' exprimant par une combinaison 

20 lineaire de termes dependant de la frequence du son (L(.f)) 
et ponderes par des termes dependant de la direction du 
son (t R/ t L/ C,D) . 

7. Procede selon la revendication 6, caracterise en ce que 
25 la direction est definie par au moins un angle azimutal 

(0) et, de preference, par un angle azimutal (0) et un 
angle d 1 elevation (cp) . 

8. Procede selon l'une des revendications 6 et 7, 
30 caracterise en ce que la position de la source virtuelle 

est parametree au moins par : 



WO 2005/069272 



PCT/FR2003/003730 



38 

plusieurs filtrages, fonctions de la frequence 
sonore (Li (f ) ) , 

plusieurs gains de ponderation associes chacun a un 
filtrage, et 

5 - un retard par voie "gauche" et "droite". 

9. Precede selon l'une des revendications precedentes, 
caracterise en ce que la nature de la source virtuelle est 
parametree au moins par un timbre sonore, en associant des 
10 intensites sonores relatives choisies a des harmoniques 
d'une frequence correspondant a une hauteur tonale du son. 



10. Procede selon l'une des revendications precedentes, 
caracterise en ce qu'il prevoit un moteur de synthese 

15 sonore propre a generer des sons spatialises, par rapport 
a ladite origine predeterminee . 

11. Procede selon la revendication 10, dans lequel le 
moteur de synthese est implements en contexte d ! edition 

20 musicale, caracterise en ce que le procede prevoit en 
outre une interface homme/machine pour placer la source 
virtuelle a une position choisie par rapport a 1 1 origine 
predeterminee . 

25 12. Procede selon la revendication 11, prise en 
combinaison avec la revendication 6, dans lequel on 
prevoit une pluralite de sources virtuelles a synthetiser 
et spatialiser, caracterise en ce que 1 1 on assigne chaque 
source a une position respective. 



30 
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13. Module de generation de sons synthetiques , comprenant 
notamment un processeur, caracterise en ce qu'il comporte 
en outre une memoire de travail propre a stocker des 
instructions pour la mise en oeuvre du procede selon l ! une 

5 des revendications precedentes . 

14. Produit programme d ' ordinateur , stocke dans une 
memoire d'une unite centrale ou d'un terminal, notamment 
mobile, ou sur un support amovible propre a cooperer avec 

10 un lecteur de ladite unite centrale, caracterise en ce 
qu'il comporte des instructions pour la mise en oeuvre du 
procede selon l'une des revendications 1 a 12 . 

15 
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